"""
工具:数据预处理的方法
    步骤:
        1.加载数据
        2.转换时间格式
        3.样本按时间顺序排序
        4.去重
"""
import pandas as pd


def data_preprocessing(path):
    """
    1.加载数据
    2.转换时间格式
    3.样本按时间顺序排序
    4.去重
    :param path: data的相对路径
    :return: 处理后的数据集
    """
    # 1.加载数据
    data = pd.read_csv(path)
    # 有time和power_load两列,时间是每个小时整点的数据,负荷是功率(MW, GW)
    print('查看数据集的信息: ', data.info())
    print('查看数据集的前5行: ', data.head())
    # 去重
    data.drop_duplicates(inplace=True)
    return data


if __name__ == '__main__':
    data = data_preprocessing('../data/test.csv')
    print(data.head())
